Corpus for Benchmarking Clinical Speech De-identification
Questo articolo presenta il corpus SREDH-AICup, un dataset di parlato clinico annotato con informazioni sensibili alla salute in inglese e mandarino, creato per colmare la carenza di risorse pubbliche e supportare la ricerca sulla de-identificazione automatica delle registrazioni mediche.